課程資訊
課程名稱
丈量社會:運用因果機器學習技術
Measuring Treatment Effects with Causal Machine Learning Techniques 
開課學期
112-2 
授課對象
社會科學院  公共事務研究所  
授課教師
王敏衡 
課號
GIPA5022 
課程識別碼
343 U0310 
班次
 
學分
1.0 
全/半年
半年 
必/選修
選修 
上課時間
星期四A,B(18:25~20:10) 
上課地點
社科研607 
備註
與盧秉謙合授
限學士班三年級以上
總人數上限:20人 
 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

機器學習等資料科學相關技術為目前行為與社會科學,甚至資訊科學的熱門議題,而因果推論更是政策評估之重要方法。本課程欲教授結合兩者之方法,例如 causal forest 或是 double machine learning 等模型,以及 variance reduction techniques 等技巧,希望能夠讓修課學生掌握此較新的工具來分析公共政策相關的資料。學期中也會有兩次邀請在美國任職的資深資料科學家,以及在美商顧問業任職於 Client Training Team的資料分析師,分別進行資料科學技巧與資料視覺化原則的授課(非演講性質)。本課程偏重實務應用與操作,若希望有更深入的理論基礎,會推薦修習其他類似課程。  

課程目標
能讓公共事務所研究所的學生建立一定程度的因果推論與機器學習知識,並懂得依照不同的需求與情境,使用相關的工具來進行資料分析。
● 具備基礎Python操作能力。
● 具備運用Python處理資料的能力。
● 瞭解資料分析或機器學習專案執行步驟。
● 具備機器學習與因果推論基礎知識。
● 具備之後將相關能力運用於研究或實務工作上之能力。 
課程要求
1. 課堂出席率25%:可請假1次。(上課前)
2. 助教課出席率15%:可請假1次。(上課前)
3. 期末報告60%:運用課程所學,撰寫資料分析專題報告,並將程式、分析過程及結果分享於GitHub上。 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
待補 
參考書目
Python and Machine Learning
1. McKinney, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. " O'Reilly Media, Inc.".
2. Harrison, M., & Petrou, T. (2020). Pandas 1. x Cookbook: Practical recipes for scientific computing, time series analysis, and exploratory data analysis using Python. Packt Publishing Ltd.
3. Geron, A. (2022). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow. " O'Reilly Media, Inc.".
Causal Inference
1. Cunningham, S. (2021). Causal inference: The mixtape. Yale university press.
2. Facure, M. (2023). Causal Inference in Python. " O'Reilly Media, Inc.". 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第1週
3/14  Week 1: Introduction to machine learning I

Machine Learning Applications

What is Machine Learning?

The Life Cycle of Machine Learning Projects

scoping
data preparation
modeling and evaluation
serving
monitoring
Data Science Roadmaps & Learning Resources 
第2週
3/21  Week 2: Introduction to Machine Learning II

Model Training Basics

Bias-variance Trade-off
Train-test Split
Hyperparameter Tuning
Model Validation
The Components of Machine Learning

Machine Learning Algorithm
Learning Objective
Optimization Strategies
Performance Metrics 
第3週
3/28  Week 3: Introduction to Machine Learning III and Causal Inference 101

Hyperparameter Optimization

Grid Search
Randomized Search
Bayesian Approach
Model Explainability

Feature Importance
Shapley Value and SHAP
Potential Outcome Model

ATE, ATT and Bias
Key Assumptions for Causal Inference from
Experimental data
observational data
Confoundedness, Self-selection, and Multicollinearity 
第4週
4/11  Week 4: Guest Lecture: Principles of Data Visualization



By Multinational Company Client Training Team Data Analyst, Victoria Yang 
第5週
4/18  Week 5: Guest Lecture: For More Efficient Experiments: Variance Reduction, Quantile Treatment Effect and Bootstrap

By Realtor.com Senior Data Scientist, Ying-Kai Huang 
第6週
4/25  Week 6: Tackling Measured / Unmeasured Confounding

Matching Methods
Instrument Variable, IV Forest
Double Machine Learning 
第7週
5/02  Week 7: Causal Mediation: Seeking Mechanism
Total, Direct, and Indirect Effects 
第8週
5/09  Week 8: Targeting the Right People

Honest Causal Trees/Forest
Heterogeneous Treatment Effects